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【摘要 】 随 着 人 工 智 能 (AI) 在 医学 领域 的 广泛 应 用 ， 越 来 越 多 基于 AI 的 临床 决策 支持 系统 应 用 于 临床 诊断 
与 筛 查 等 。 早 期 临床 评价 对 于 评估 AI 临床 决策 支持 系统 的 临床 性 能 、 安 全 性 和 人 为 因素 具有 重要 意义 ， 并 为 进一步 
的 大 规模 临床 试验 黄 定 基础 ， 但 相关 临床 研究 报告 的 透明 度 和 完整 性 尚 待 提高 。2022 年 5 月 基于 AI 的 临床 决策 支持 
系统 早期 临床 评估 报告 指南 (DECIDE-AI ) 正式 在 线 发 表 。 本 文 将 结合 DECIDE-AI 中 的 AI 相关 报告 项 目 及 相关 文献 ， 
探讨 基于 AI 的 临床 决策 支持 系统 早期 临床 评估 的 透明 化 报告 ， 以 期 帮助 我 国 AI 临床 决策 支持 系统 的 开发 者 和 研究 者 
更 好 地 理解 与 应 用 相关 指南 ， 提 高 AI 临床 决策 支持 系统 早期 临床 评估 报告 的 透明 度 。 
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【Abstract 】 With the wide application of artificial intelligence ( AI ) in the medical field, more and more ATI- 

based clinical decision support systems have been applied in the clinical diagnosis, screening, and other fields. Early clinical 
evaluation is important for evaluating the clinical performance, safety, and human factors of AI-based clinical decision support 
systems, and laying the foundation for large—scale trials. However, the transparency and integrity of the clinical reports need to be 
improved. The Developmental and Exploratory Clinical Investigations of Decision support systems driven by Artificial Intelligence 

(DECIDE-AI ) was officially published online in May 2022. Based on this guideline and relative literature, this paper explores 
the transparent reporting of early—stage clinical evaluation of AI-based decision support systems, in order to help developers and 
researchers of AI-based clinical decision support system better understand and apply the relevant guidelines, and improve the 


reporting transparency of early clinical evaluation of AI-based clinical decision support systems. 
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近 十 年 来 ， 为 提高 医疗 服务 质量 和 效率 ， 人 工 智能 
(artificial intelligence，AI ) 已 广泛 应 用 于 临床 诊断 、 筛 
查 等 方面 。 尽 管 有 研究 指出 ， 在 临床 前 的 计算 机 模 
拟 研究 中 一 些 基于 AI 的 算法 准确 性 与 临床 专家 相似 ， 
但 AI 临床 决策 支持 系统 在 临床 决策 中 的 应 用 受到 复杂 
的 人 为 和 环境 因素 影响 ， 从 算法 到 临床 应 用 需要 经 过 多 
个 阶段 的 评 佑 ， 包 括 计算 机 模拟 试验 、 临 床 早 期 评估 和 
临床 随机 对 照 试验 。 其 中 ，AI 临床 决策 支持 系统 
的 早期 临床 评估 的 目的 是 ,在 大 型 临床 随机 对 照 试验 前 ， 
于 临床 应 用 场景 中 对 AI 临床 决策 支持 系统 的 临床 性 能 、 
安全 性 和 人 为 因素 等 进行 验证 ， 为 以 后 的 大 规模 临床 试 
验 葛 定 基础 。 因 此 ，AI 临 床 决策 支持 系统 的 早期 临床 
评估 十 分 重要 。 

临床 研究 报告 的 透明 化 有 助 于 提高 试验 的 可 靠 性 和 
结果 的 可 重复 性 。 此 外 ， 从 伦理 方面 来 计 ，AI 决 策 的 
透明 性 和 可 解释 性 也 是 相当 重要 的 "| 。 目 前 ，AI 相关 
的 临床 研究 报告 的 透明 度 和 完整 性 尚 待 提高 。 有 系统 评 
价 研究 指出 ，AI 相关 的 临床 研究 报告 缺乏 透明 性 ， 其 
至 有 些 研究 本 身 存在 较 大 缺陷 ， 如 未 报告 数据 预 处 理 信 
息 、 偏 倚 风 险 等 ， 也 有 研究 未 评估 模型 适用 性 或 未 经 外 
部 验证 ，” 。AI 相关 的 临床 研究 报告 规范 可 帮助 研究 者 
提高 报告 的 完整 性 和 透明 度 。2022 年 5 月 基于 AI 的 临 
床 决 策 支 持 系统 早期 临床 评估 报告 指南 (Developmental 
and 上 Exploratory Clinical Investigations of DEcision support 
systems driven by Artificial Intelligence, DECIDE-AI ) Ba 
正式 在 线 发 表 ，DECIDE-AI 主要 针对 早期 临床 评估 ， 
该 研究 阶段 类 似 于 药物 开发 的 第 1/2 阶段 ， 或 外 科 创 新 
技术 / 带 械 临床 研究 设计 、 开发、 评价 、 长 期 随访 ( Idea， 
Development, Exploration, Assessment, and Long-term 
follow up，IDEAL ) 框架 的 第 2a/2b 阶段 "2 。DECIDE- 
AI 共 包含 27 个 报告 条 目 ,其 中 AI 相 关 报 告 条 目 17 个 ( 共 
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1 AI 临床 决策 支持 系统 的 预期 用 途 


基于 AI 临床 决策 支持 系统 的 早期 临床 研究 报告 需 
要 对 系统 的 目标 用 户 、 临 床 应 用 场景 和 预期 效果 进行 适 
当 描 述 。AI 临床 决策 支持 系统 融合 了 多 种 跨 学 科 知 识 
和 技术 , 其 对 用 户 有 一 定 的 要 求 , 包括 专业 、 培 训 水平 、 
计算 机 技术 等 ; 此外， 对 于 AI 临床 决策 支持 系统 的 临 
床 应 用 场景 和 预期 效果 的 描述 ， 包 括 其 适用 范围 、 可 能 
给 现 有 临床 路 径 带 来 的 改变 和 影响 等 ， 不 仅 有 利于 增加 
临床 医生 或 患者 对 AI 临床 决策 支持 系统 的 了 解 ， 提 高 
其 对 AI 临床 决策 支持 系统 的 信任 和 满意 度 ， 同 时 可 促 
进 AI 临床 决策 支持 系统 的 传播 和 实施 。 


2 ”研究 过 程 的 透明 化 报告 


尽管 行业 协会 或 组 织 均 发 布 政策 ， 要 求 在 卫生 保健 
和 研究 领域 开发 AI 项 目 时 保持 透明 性 ， 但 由 于 其 固有 
的 复杂 性 ，AI 仍 缺 乏 透 明 性 ,包括 算 法 缺乏 可 解释 性 、 
所 有 阶段 数据 不 够 透明 、 数 据 偏见 以 及 模型 版 本 化 不 够 
透明 等 。AI 的 透明 性 对 各 利益 依 关 方 都 意义 重大 ， 包 
括 研发 者 、 使 用 者 、 审 批 和 监管 机 构 等 。 下 面 主要 从 参 
与 者 、AI 临床 决策 支持 系统 、 实 施 、 安 全 和 故障 、 人 
为 因素 5 个 方面 对 研究 过 程 透明 化 报告 进行 阐述 。 
2.1 参与 者 

AI 诊断 工具 相关 的 Meta 分 析 显 示 ， 大 部 分 研究 存 
在 较 高 的 患者 选择 偏 倚 风 险 '“" 。 患 者 选择 偏 倚 不 仅 
影响 AI 诊断 模型 的 推广 ， 更 重要 的 是 ， 可 能 会 产生 系 
统 错误 ， 即 输出 错误 的 结果 。 因 此 ， 应 加 强 患者 招募 过 
程 的 透明 化 报告 ， 从 患者 和 数据 层面 报告 纳入 与 排除 标 
准 ， 以 及 患者 招募 数量 的 确定 方法 。AI 临床 决策 支持 
系统 的 参与 者 除 患 者 以 外 ， 还 包括 用 户 ， 用 户 与 AI 临 
床 决策 支持 系统 之 间 的 交互 也 将 对 系统 性 能 和 研究 结 
产生 影响 ， 因 此 不 仅 需 要 报告 用 户 的 招募 过 程 以 及 纳入 


28 个 子 条 目 ) 、 通 用 报告 条 目 10 个 。DECIDE-AI 主要 
关注 临床 可 用 性 、 安 全 性 和 人 为 因素 ， 因 此 该 指南 对 试 
验 评估 环境 、 实 施 过 程 、 人 为 因素 等 都 提出 了 具体 要 求 。 

为 推动 我 国 AI 临床 决策 支持 系统 早期 临床 研究 及 
其 报告 的 规范 化 和 透明 化 ， 本 文 将 结合 DECIDE-AI 中 
的 AI 相关 报告 项 目 及 相关 文献 ， 从 AI 临床 决策 支持 系 
统 的 预 其 用途、 研究 过 程 、 伦 理 和 数据 共享 几 个 方面 探 
讨 基 于 AI 的 临床 决策 支持 系统 早期 临床 评估 的 透明 化 
报告 ， 以 促进 报告 规范 的 理解 与 应 用 ， 提 高 AI 临床 决 
策 支 持 系 统 早 期 临床 评估 报告 的 透明 度 。 


与 排除 标准 ， 还 需要 描述 用 户 熟 悉 AI 临床 决策 支持 系 
统 使 用 所 需 时 间 和 工作 量 , 但 DECIDE-AI 指南 不 推荐 
从 数据 层面 排除 用 户 。 此 外 ， 研 究 者 也 可 在 临床 试验 注 
册 平 台 进 行 预 注册 ， 这 是 提高 临床 研究 过 程 透明 化 的 重 
要 途径 ， 同 时 这 也 符合 《赫尔辛基 宣言 》、WHO 和 国 
际 医学 杂志 编辑 委员 会 对 临床 试验 注册 的 要 求 。 
2.2 AI 临床 决策 支持 系统 

AI 临 床 决策 支持 系统 可 能 会 经 历 多 次 迭代 和 更 新 。 
有 研究 表明 ， 与 决策 支持 过 程 相 匹配 的 算法 可 在 一 定 程 
度 上 减少 系统 的 固有 偏 倚 '“| 。 除 了 算法 ，AI 临床 决策 
支持 系统 的 另 一 大 核心 便 是 数据 ， 大 多 数 AI 临床 决策 
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文 持 系统 都 需要 大 型 数据 集 来 进行 训练 和 验证 ， 因 此 数 
据 的 获取 、 输 入 以 及 处 理 都 在 一 定 程 度 上 决定 了 AI 临 
床 决策 支持 系统 的 性 能 “" 。 在 AI 临床 决策 支持 系统 
输出 方面 ， 输 出 内 容 和 呈现 方式 一 定 程度 上 影响 了 用 户 
对 系统 的 使 用 和 接受 度 '"”| ， 而 良好 的 人 机 交互 建立 在 
合理 的 用 户 界面 设计 基础 上 。 为 此 ， 作 者 在 研究 设计 和 
撰写 研究 报告 时 , 都 应 仔细 考虑 并 描述 算法 类 型 和 版 本 、 
输入 数据 相关 信息 以 及 输出 内 容 和 交互 界面 设计 等 。 
2.3 实施 

在 实施 方面 ， 与 AI 临床 试验 报告 统一 标准 
( Consolidated Standards of Reporting Trials - Artificial 
Intelligence，CONSORT-AI) 和 AI 临床 试验 方案 报 
告 指 南 (Standard Protocol Items: Recommendations for 
Interventional Trials - Artificial Intelligence, SPIRIT-AI) 
不 同 ，DECIDE-AI 除了 要 求 报告 AI 临床 决策 支持 系统 
的 输出 如 何 应 用 到 临床 决策 , 还 要 求 清楚 描述 评估 环境 ， 
如 医疗 中 心 的 类 型 和 规模 、 软 硬件 支持 等 。 这 些 环境 因 
素 可 能 会 影响 数据 的 获取 或 测量 , 进一步 影响 输出 结果 。 
研究 者 还 需要 报告 最 终 的 临床 决策 是 如 何 形成 的 、 用 户 
使 用 系统 情况 及 对 现 有 诊疗 和 护理 流程 的 重要 改变 ， 这 
可 能 在 一 定 程 度 上 反映 了 AI 临床 决策 支持 系统 的 可 用 
性 和 临床 实用 性 。 
2.4 安全 和 故障 

安全 问题 是 医学 AI 的 首要 问题 ， 它 涉及 各 种 法 律 
和 伦理 问题 “ ， 并 贯穿 整个 临床 研究 和 实践 过 程 。 
此 ， 在 大 型 临床 研究 前 ， 对 AI 临床 决策 支持 系统 进行 
安全 评 佑 尤为 重要 ， 以 避免 造成 灾难 性 后 果 。 当 然 ， 在 
使 用 AI 临床 决策 支持 系统 的 过 程 中 ， 安 全 风险 或 故障 
不 仅 涉 及 系统 本 身 ， 软 硬件 支持 和 用 户 使 用 情况 也 可 能 
会 产生 错误 。 如 何 识别 这 些 故 障 、 如 何 评 佑 患者 安全 风 
险 、 如 何 最 小 化 患者 伤害 ， 都 需要 研究 者 提前 制定 好 相 
应 的 安全 风险 预案 ， 并 详细 报告 。 
2.5 人 为 因素 

人 为 因素 的 评估 主要 围绕 用 户 的 使 用 情况 ， 即 可 用 
性 。 可 用 性 是 指 一 个 产品 可 以 被 指定 用 户 使 用 ， 并 在 指 
定 使 用 情景 中 ， 有 效 地 、 有 效率 地 、 满 意 地 达到 指定 目 
标的 程度 ， 这 直接 影响 了 用 户 对 系统 的 接受 度 。 所 
以 , 研究 者 可 采用 量 表 、 问 卷 调查 表 等 方式 ,从 满意 度 、 
完成 任务 的 效率 和 工作 量 等 方面 进行 评 佑 。 如 广泛 用 
于 系统 可 用 性 研究 的 系统 可 用 性 量 表 ( System Usability 
Scale，SUS )“” 可 快速 评估 可 用 性 ， 该 量 表 包 含 10 个 
条 日， 每 个 条 目的 得 分 为 0~4 分 。 另 外 ， 也 可 采用 净 推 
荐 值 (net promoter score， NPS ) [1 ， 即 用 一 个 简单 的 
问题 来 评估 用 户 的 满意 度 。 事 实 上 ， 生 活 中 类 似 的 NPS 
调查 也 很 常见 ， 如 “你 向 朋友 推荐 XX 产品 的 可 能 性 有 
多 大 ? ”或 “你 会 向 你 的 朋友 推荐 XX 产品 吗 ? ”。 关 
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于 如 何 选 择 恰当 的 方法 ， 可 以 参考 相关 指导 文件 '” 。 

DECIDE-AI 指出 ， 报 告 中 需要 对 结果 是 否 支 持 AI 
临床 决策 支持 系统 的 预期 用 途安 全 提示 进行 充分 阐述 ， 
这 充分 体现 了 早期 临床 研究 的 目标 ， 即 临床 应 用 性 和 安 
全 性 。 在 临床 应 用 性 方面 ， 研 究 者 应 根据 研究 结果 客观 
描述 系统 的 临床 表现 ， 避 人 免 夸 大 其 应 用 潜能 ， 这 将 对 后 
期 是 否 继续 优化 和 完善 AI 临床 决策 支持 系统 以 及 是 否 
进一步 进行 临床 验证 提供 重要 的 证 据 支 持 ， 避 免 不 必 要 
的 人 力 、 物 力 和 财力 的 浪费 。 对 系统 安全 性 的 讨论 可 促 
进 AI 临床 决策 支持 系统 优化 ， 并 增强 用 户 或 患者 对 系 
统 的 信任 。 


3 伦理 


AI 临床 决策 支持 系统 在 促进 医疗 服务 质量 提升 和 
生产 力 提高 的 同时 ， 也 带 来 了 一 系列 伦理 挑战 ， 比 如 患 
者 的 数据 隐私 、 系 统 的 准确 性 、 算 法 偏见 等 。 尽 管 在 医 
疗 AI 中 ， 医 疗 保健 数据 集 通常 在 开发 人 员 使 用 前 被 去 
识别 化 ， 软 件 也 有 可 能 通过 与 其 他 数据 之 间 的 交叉 引用 
来 重新 识别 底层 个 体 。2022 年 3 月 发 布 的 我 国 首 个 国 
家 层面 的 科技 伦理 治理 指导 性 文件 《关于 加 强 科 技 伦理 
治理 的 意见 》 提 出 ， 科 技 伦理 是 开展 科学 研究 、 技 术 开 
发 等 科技 活动 需要 遵循 的 价值 理念 和 行为 规范 ， 是 促进 
科技 事业 健康 发 展 的 重要 保障 ” 。2023 年 2 月 由 国家 
卫生 健康 委 、 教 育 部 、 科 技 部 和 国家 中 医药 局 联合 发 布 
的 《涉及 人 的 生命 科学 和 医学 研究 伦理 审查 办 法 》 强 调 
了 伦理 审查 的 重要 性 ， 并 指出 “涉及 人 的 生命 科学 和 医 
学 研究 应 当 尊 重 研 究 参与 者 ， 遵 循 有 益 、 不 伤害 、 公 正 
的 原则 ， 保 护 隐私 权 及 个 人 信息 ”5 。 在 AI 临床 决 
策 支 持 系统 的 开发 和 应 用 中 需要 始终 坚持 “伦理 先 于 技 
术 ” 的 原则 ， 必 要 时 可 采用 适当 的 技术 方法 或 伦理 学 方 
法 以 降低 相关 伦理 风险 ， 如 隐私 计算 技术 可 使 数据 “可 
用 而 不 可 见 ”， 避 免 隐私 数据 泄露 。AI 相关 的 伦理 内 
容 与 传统 医学 伦理 并 不 完全 一 致 ， 因 此 应 当 加 强 AI 相 
关 医 学 伦理 的 宣传 与 审查 。 学 术 期 刊 作为 研究 结果 的 重 
要 传播 平台 ， 应 发 挥 好 宣传 与 审查 作用 。 然 而 ， 根 据 我 
们 的 调查 ， 目 前 很 少 有 国内 外 医学 期 刊 更 新 投稿 指南 或 
作者 须知 ， 补 充 AI 相关 的 医学 伦理 要 求 '*| 。 


4 数据 共享 


如 前 所 述 ， 算 法 和 数据 是 AI 临床 决策 支持 系统 的 
两 大 核心 , 分 享 相关 数据 一 方面 可 供 读者 验证 研究 结果 ， 
男 一 方面 也 可 促进 交流 、 完 善 算法 代码 ， 同 时 这 也 符合 
透明 化 和 可 重复 性 原则 。 数 据 获取 是 验证 和 共享 AI 产 
生 的 科学 知识 的 方式 。 数 据 共享 不 仅 是 为 了 促进 科学 发 
展 ， 同 时 也 是 为 了 提高 科学 的 严谨 性 。 由 于 AI 研究 与 
代码 和 数据 密 不 可 分 ， 因 此 应 该 更 加 强调 代码 和 数据 共 
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享 ， 深化 AI 临 床 试验 的 价值 , 预防 错误 、 欺 诈 或 偏 倚 。 
因此 ， 除 了 声明 利益 冲突 外 ， 作 者 还 应 该 声明 相关 数据 
和 代码 是 否 可 获取 以 及 如 何 获取 。 随 着 开放 科学 时 代 的 
到 来 ， 数 据 共享 将 变 得 越 来 越 重 要 。 


Ss 总 结 


随 着 AI 在 医学 领域 的 广泛 应 用 ， 为 增加 研究 报告 
的 完整 性 和 透明 性 ， 相 应 的 报告 规范 〈 指南 ) 不 断 地 被 
开发 出 来 。DECIDE-AI 为 AI 临床 决策 支持 系统 的 研究 
报告 提供 了 一 个 框架 ， 以 帮助 开发 人 员 和 研究 者 报告 开 
发 、 实 施 和 评估 过 程 中 的 关键 信息 。 该 指南 主要 关注 了 
早期 临床 评估 的 3 个 方面 : 小 规模 临床 使 用 的 临床 实用 
性 、 安 全 性 和 人 为 因素 。 为 进一步 促进 DECIDE-AI 的 
传播 ， 加 强 相 关 研 究 报告 的 规范 性 、 完 整 性 和 透明 性 ， 
同时 为 作者 在 研究 设计 、 方 案 制定 和 研究 注册 过 程 中 提 
供 参考 标准 ， 建 议 期 刊 将 DECIDE-AI 纳入 稿约 或 作者 
须知 。 但 由 于 AI 临床 决策 支持 系统 在 临床 应 用 中 可 能 
面临 多 种 多 样 的 问题 和 挑战 ， 因 此 研究 人 员 在 运用 该 指 
南 时 ， 需 要 根据 实际 情况 进行 调整 和 改进 。 同 时 ， 由 于 
制定 该 指南 的 专家 大 多 来 自 英 国 ， 所 以 可 能 会 有 一 定 的 
局 限 性 。 尽 管 如 此 ， 该 指南 给 AI 临床 决策 支持 系统 的 
相关 研究 及 报告 提供 了 一 定 的 方向 ， 有 利于 促进 AI 在 
医疗 领域 的 可 持续 发 展 。 
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